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摘要 : 随 着 互联 网 发 展 的 日 益 深入 ， 网 络 已 成 为 当今 社会 信息 传播 的 主要 媒介 之 一 。 网 络 与 情形 成 迅速 ， 
对 社会 影响 巨大 ， 加 强 网 络 与 情 的 监测 和 分 析 ， 值 得 引起 社会 各 界 的 高 度 重 视 。 天 珊 与 情 监测 系统 是 专门 
针对 网 络 与 情 监测 的 工作 要 求 和 特点 而 打造 的 ， 不 仅 采 用 了 专业 化 的 搜索 引擎 技术 ， 还 融入 了 更 加 智能 的 
数据 挖掘 技术 ， 建立 一 个 以 日 为 周期 的 网 络 与 情 监测 平台 ， 同 时 配 上 以 周 或 者 以 月 为 基础 的 舆情 分 析 报 告 ， 
从 而 提供 了 一 个 便捷 、 科 学 、 可 操作 的 与 情 工作 平台 。 
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1 引言 


所 谓 网 络 与 情 指 的 是 在 一 定 的 社会 空间 内 , 在 网 络 中 国 绕 社会 事件 的 发 生 、 发展 和 变化 ， 
民众 对 公共 问题 和 社会 管理 者 产生 和 持 有 的 社会 政治 态度 、 信 念 和 价值 观 。 它 是 较 多 民众 关 
于 社会 中 各 种 现象 、 问 题 所 表达 的 信念 、 态 度 、 意 见 和 情绪 等 等 表现 的 总 和 。 


网 络 熏 情 呈现 的 影响 力 日 趋 增 加 ， 已 渗入 到 从 政府 决策 到 社会 政治 、 经 济 、 文 化 和 日 常 
生活 的 各 个 层面 , 但 种 种 偏颇 的 评论 或 损害 国家 安全 与 社会 稳定 的 虚假 信息 也 随 之 而 来 , 正 
确 引 导 网 络 与 情 已 成 为 维护 社会 安定 的 重大 课题 。 


本 文 第 二 部 分 概述 当前 网 络 与 情 的 情况 ; 第 三 部 分 分 析 了 网 络 与 情 监测 的 需求 ; 
分 深入 浅 出 地 对 天 丽 和 与 情 系 统 解 决 方案 进行 了 介绍 ; 最 后 总 结 天 珊 与 情 系统 的 技术 特点 和 
际 效 果 。 


2 “网络 与 情 现状 及 特点 


网 络 与 情 所 面向 的 是 网 络 导 论 这 种 新 兴 的 与 论 形式 , 它 上 共有 其 它 与 论 形式 所 不 具备 的 特 
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第 一 ， 网络 与 情 具 有 匿名 性 和 虚拟 性 ,难以 有 效 监 管 和 规范 ， 发 言 者 基本 无 需 芳 虑 承担 
法 律 责任 的 问题 。 

第 二 ， 网 络 信息 真实 性 难以 辨别 ， 部 分 网 民 很 少 质疑 信息 的 真实 性 ， 也 没有 进行 成 熟 的 
思辨, 仅 赁 主观 腊 断 对 信息 发 表意 见 ， 带 有 很 浓厚 的 感情 色彩 ， 易 导致 真相 的 掩盖 、 言 论 的 
局 鼎 。 

第 三 ， 网 络 舆 情 传 播 快 、 范 围 广 、 聚 集 效 应 强 ， 但 可 探 性 较 差 。 对 在 网 络 中 四 处 粘贴 攻 
击 旗 毁 的 消息 ， 有 关 部 门 上 只 能 被 动 删 除 ， 防 不 胜 防 。 


于 网 络 与 情 的 特点 ， 使 其 能 够 产生 巨大 的 引导 效应 ， 正 面 来 看 : 
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1. ”网络 与 情 有 利于 真实 民意 的 充分 表达 , 使 政府 及 时 准确 了 解 群众 心声 。 由 于 网 络 民 
意 生 存 空间 的 虚拟 性 ， 使 得 民意 主体 敢于 表达 自己 的 真实 心声 ， 在 网 络 公共 空间 、 
尤其 是 网 络 论坛 ， 网 民 能 够 就 时 事 发 表 看 法 、 展 开 争 论 。 

2. 网 络 与 情 能 为 政府 科学 决策 提供 依据 ,有 利于 扩大 公众 的 参与 权 , 提高 公民 的 主人 
公 地 位 。 从 整体 上 说 ,无 论 是 哪 一 种 网 络 与 情 的 出 现 ， 均 体现 了 网 民 对 国家 的 前 途 

命运 和 社会 的 公共 事务 的 关心 ， 也 体现 了 网 民 参 与 意识 和 主人 翁 精 神 的 日 益 增强 。 

在 信息 时 代 ， 网 络 与 情 逐 渐 成 为 政府 倾听 民 声 、 了 解 民 意 的 一 个 重要 渠道 。 

3. 通过 意见 领袖 的 引领 能 冲淡 一 些 情绪 型 过 激 言 论 ， 有 利于 缓解 渐 趋 紧张 的 社会 巴 

盾 。 在 网 络 论坛 中 有 一 大 批 的 “导论 领袖 ”， 他 们 的 文字 表达 能 力 强 、 分 析 问 题 深 

刻 、 有 独特 见解 ， 他 们 的 言论 往往 在 潜移默化 中 影响 其 他 网 民 的 看 法 。 因 此 ， 由 他 
们 所 引导 的 健康 、 理 性 的 言论 能 控制 一 些 负面 的 影响 ， 有 事半功倍 的 效果 。 

4. 网络 与 情 能 促进 对 政府 官员 的 监督 、 提 高 社会 的 透明 度 ， 有 利于 约束 不 良 之 风 。 网 
民 参 与 的 普遍 性 和 不 受 控制 性 ,使 得 网 络 熏 情 无 时 不 在 、 无 处 不 在 ， 健 然 一 张 群众 
监督 的 “天 网 ” 使 很 多 公共 权力 的 运作 被 置 于 阳光 之 下 ， 从 而 有 利于 促进 社会 透 
明度 的 增加 和 政府 信息 公开 。 


但 是 另 一 方面 ， 网 络 导 情 也 会 带 来 一 些 负面 效应 : 


1. 网 民 的 情绪 化 导致 网 络 暴 力 频 繁 出 现 。 由 于 发 言 者 身份 隐蔽 , 并 且 缺 少 规则 限制 和 
有 效 监督 ， 有 些 人 在 面 对 困 难 和 问题 时 ， 会 把 网 络 这 个 “虚拟 ”的 世界 作为 不 良 情 
绪 的 宣泄 空间 。 

2. 网络“ 把 关 人 ”缺失 导致 网 络 虚假 信息 泛滥 ， 干扰 了 网 民 的 正确 判断 ， 甚 至 于 扰乱 
了 正常 的 社会 秩序 。 

3. “意见 领袖 ”的 恶意 引导 引发 “蝴蝶 效应 ”。 一 些 反 动 、 分 裂 势力 在 网 络 上 以 各 种 
面目 出 现 ， 制 造 和 利用 网 络 谣言 ， 煽 动 激进 情绪 ， 使 网 络 与 情 显 得 异常 复杂 。 


3 ”网 络 与 情 监测 需求 


网 络 与 情 的 特点 决定 了 恒 情 信息 工作 的 时 效 性 非常 强 。 与 情 变 化 的 节拍 经 常 是 以 小 时 计 
算 。 为 了 汇总 与 情 ， 要 浏览 和 查找 海量 的 网 络 信息 ， 包 括 网 络 新 闻 报 道 、 相 关 评 论 、 网 络 论 
坛 、 博 客 等 ， 从 这 些 信 息 中 提取 与 事件 相关 的 与 情 信息 ， 然 后 分 析 与 情 信 息 的 时 间 与 空间 分 
布 情况 。 为 提高 舆情 工作 的 时 效 ， 必 须 充 分 运用 现代 网 络 技术 ， 及 时 有 效 地 进行 信息 搜集 、 
信息 处 理 、 信 息 研 判 、 信 息 反 馈 、 决 策 ， 这 就 需要 强 有 力 的 技术 手段 的 支持 。 


从 业务 需求 上 看 ， 网 络 与 情 监测 包括 日 常 监测 和 突 发 事件 监测 两 种 方式 : 


日 常 监测 ， 指 将 网 络 与 情 监 测 作为 本 部 门 的 一 项 上 日常 工作 不 间断 进行 ,随时 掌握 网 络 与 
论 的 导向 、 特 点 和 趋势 。 日 常 监测 的 意义 在 于 ， 随 时 了 解 网 络 与 论 的 动态 、 方 向 ， 一 旦 发 现 
负面 的 、 重 大 的 虚假 舆情 苗头 ， 可 以 及 时 采取 措施 ， 对 日 常 导 情 进 行 引导 ， 为 有 关 部 门 提 供 
决策 文 持 。 


突 发 事件 监测 ， 指 当 发 生 群 体 性 突 发 事件 时 ， 对 相关 网 络 与 情 的 监测 。 突 发 事件 的 变化 
因素 多 ， 内 部 关系 较为 复杂 ， 发 展 趋势 难以 预测 ， 相 关 信 息 纷繁 复杂 ,会 给 信息 判断 和 决策 
增加 很 大 的 难度 。 男 外 ， 由 于 突 发 事件 中 的 矛盾 双方 往往 处 于 对 立 状 态 ， 影响 或 阻碍 了 原 有 
信息 沟通 渠道 的 正常 功能 ， 从 而 给 各 种 “小 道 消息 ”提供 了 填补 信息 真空 的 机 会 。 此 类 事件 
突 发 性 强 、 社 会 影响 大 、 给 决策 者 思考 的 时 间 短 ， 如 果 不 及 时 准确 获得 最 新 信息 并 加 以 判断 
处 理 ， 产 生 的 后 果 非 常 严 重 。 因 此 ， 在 突 发 事件 出 现时 ， 完 善 的 舆情 监测 机 制 、 及 时 有 效 的 
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测 需要 在 互联 网 的 海量 信息 中 进行 , 工作 时 效 性 要 求 非常 高 ， 
上 海量 信息 的 收集 和 处 : 
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j 信 息 的 检索 
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图 1. 天 珊 与 情 系统 基本 架构 
天 珊 与 情 监 测 系统 是 专门 针对 网 络 与 情 监测 的 工作 要 求 和 特点 而 打造 的 , 不 仅 采 用 了 专 
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监测 平台 ， 同 时 配 上 以 周 或 者 以 月 为 基础 的 舆情 分 析 报 告 ， 从 而 提供 了 一 个 便捷 、 科 学 、 可 
操作 的 与 情 工作 平台 。 


天 丽 与 情 系统 采用 的 信息 采集 、 信 息 抽取 、 汉 语 分 词 、 全文 检索 、 自 动 消 重 、 关 联 分 析 、 
关键 词 提 取 、 自 动 摘要 、 分 类 聚 类 、 个 性 化 信息 主动 推送 等 技术 ， 能 够 对 海量 信息 进行 智能 
检索 、 智 能 处 理 、 智 能 分 析 ， 为 用 户 提供 热点 专题 监控 、 个 性 化 信息 推送 、 精 确 全 文 检索 等 
服务 ， 提 供 客观 、 完 整 、 准 确 的 与 情 监测 报告 ， 便 于 用 数据 、 用 图 表 来 解读 与 情 ， 减 少 主观 
腾 断 。 
天 现 与 情 系统 采用 图 1 所 示 的 技术 和 三 层 软件 架构 ， 能 满足 与 情 监 测 的 以 下 需求 ; 
1. 提高 效率 ， 扩 大 了 解 民情 与 情 的 范围 
人 工 监控 网 络 信息 不 仅 速度 慢 、 效 率 低 ， 要 花费 大 量 的 人 力 和 物力 ， 并 且 还 不 能 穷 
尽 所 关注 的 热点 和 专题 。 而 利用 天 珊 系 统 的 信息 采集 技术 ， 可 以 24 小 时 不 间断 地 监控 
全 网 和 成 千 上 万 个 指定 频道 的 信息 ,并 且 不 会 重复 和 遗漏 ,无疑 增 加 了 与 情 监控 的 数量 
和 范围 ， 提 高 了 品质 。 
~ 2. 和 与 情 监测 实时 准确 
CO 于 采取 了 24 小 时 定向 监控 ， 网 络 任何 的 最 新 信息 都 能 被 及 时 发 现 和 识别 ， 通 过 
二 监控 知识 库 的 判断 和 分 析 ， 一 发 现 问 题 就 产生 报警 消息 ， 及 时 推送 给 管理 部 门 知晓 使 
之 及 时 掌握 与 情 爆发 点 和 事态 发 展 趋势 ， 真 正 起 到 了 “网 络 监督 员 ” 的 作用 。 
3. 突 发 事件 从 容 应 对 
OO 遇 到 突 发 事件 和 重大 专题 , 系统 自动 进行 首发 地 址 的 追踪 、 统计 走势 和 传播 路 径 的 
ee 分 析 ， 并 能 够 24 小 时 不 间断 地 对 删 帖 状 态 和 网 络 活跃 分 子 进行 监控 ， 对 网 民 的 多 种 观 
© 点 和 意见 进行 分 析 ， 从 而 能 够 有 效 把 握 和 与 情态 势 ， 并 通过 权限 联动 产生 各 方面 力量 的 合 
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日 日 简报 ， 月 月 专 报 ， 
要 事 快 报 ; 还 可 以 针对 
社会 与 论 热点 ,自动 生 


==== “与 我 相关 ”的 与 情 


成 热点 与 情报 告 , 报告 ”网 57 去 重 后 的 与 情 

内 容 图 文 并 茂 ,提供 了 下 
量 的 统计 分 析 和 网 \、 25 ] i ie 

民 观 点 分 析 , 能 够 为 辅 \、 8000 /---------- 乌 情 热度 分 析 

助 决策 提供 很 大 帮助 。 ee 

任务 完成 后 可 生成 处 /Tm 负面 与 情 

置 结果 报告 ,反映 工作 No/------=--====“ 简报 和 专 报 

的 效果 和 效率 。 


图 2. 天 丽 与 情 系 统 监 测 与 情 信息 


[wilh 


在 天 珊 与 情 系 统 的 协 
助 下 ,仅仅 关注 系统 智能 推送 的 少量 信息 ， 就 能 达到 全 网 监测 的 效果 ,与 情 工作 从 此 变 得 高 
效 而 有 趣 。 
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5 “天 珊 与 情 系统 特点 


天 丽 网 络 与 情 监 测 系 统 融 合 了 中 科 院 计算 所 在 内 容 深 度 挖 据 技术 领域 10 多 年 来 的 研究 
果 ， 含 有 多 项 专利 技术 ， 其 前 期 的 互联 网 智能 搜索 挖掘 系统 曾 获 得 国家 科技 进步 一 等 奖 。 
其 中 的 多 文档 摘要 、 网 页 与 博客 专家 搜索 、 信息 过 滤 3 项 技术 先后 获得 了 信息 智能 处 理 世 界 
级 比赛 一 一 国际 文本 检索 CTREC) 大赛 第 一 名 ; 中 文 分 词 技术 国内 外 公开 测评 第 一 ， 是 国 
际 上 公认 的 汉语 分 析 第 一 品牌 ; 话题 发 现 与 跟踪 技术 获得 国际 话题 检测 与 跟踪 (Topic Detect 
and Tracking, TDT) 评测 全 球 第 二 名 等 多 项 荣誉 。 先 进 的 技术 带 来 了 天 珊 怀 情 系 统 全 面 、 高 
效 、 准 确 、 深 入 等 四 大 优点 ， 具 体 体 现在 以 下 四 个 方面 : 

1. 信息 全 面 获取 

信息 获取 是 指 从 网 络 中 高 速 准确 地 采集 数据 , 提取 相关 元 信息 。 天 丽 网 络 与 情 监 测 
系统 能 够 快速 高 效 获取 网 页 ， 支 持 Javascript 等 多 种 复杂 页 面 形式 ， 支 持 网 页 编码 自动 
识别 和 转换 ， 支 持 基 于 cookie 状态 检测 的 采集 ， 具 有 反 “ 防 刷新 ”的 采集 机 制 ， 可 定 


二 向 采集 并 抽取 新 闻 、 论 坛 、 博 客 等 各 类 复杂 的 信息 内 容 ， 支 持 元 搜索 主题 采集 ， 在 各 大 
己 搜索 引擎 基础 上 只 采集 用 户 感 兴趣 的 内 容 ， 信 息 全 面 ， 更 新 及 时 。 

CO 

LO 2. 自然 语言 理解 

-= 自然 语言 理解 的 目标 是 让 计算 机 像 人 类 一 样 真正 理解 各 类 庞杂 信息 中 的 语言 语义 ， 
S 为 进一步 的 深入 挖掘 提供 可 信 的 知识 依据 。 天 现 与 情 系统 内 芍 强 大 的 汉语 词法 分 析 器 
cq ICTCLAS， 集 成 了 高 效 的 正文 与 关键 词 提取 技术 ， 可 去 除 网 页 中 的 噪音 ， 自 动 计 算出 
©O 有 代表 性 的 关键 词汇 ; 文本 分 类 聚 类 算法 快速 精准 ;文档 摘要 可 以 自动 分 析 文 档 的 内 容 ， 
提供 简短 准确 的 文本 摘要 。 

: 3. 信息 智能 搜索 

上 信息 智能 搜索 可 提供 更 智能 化 、 专 业 化 与 人 性 化 的 信息 搜索 服务 。 天 现 与 情 系统 采 


用 分 布 式 全 文 检索 系统 I3Search， 艇 入 了 碍 询 理解 的 最 新 研究 成 果 ， 自 动 挖掘 潜在 语义 
关联 ， 内 核 经 过 精心 设计 ， 是 高 扩展 性 与 高 性 能 的 完美 组 合 。 系 统 文 持 文本 、 数 字 、 日 


全 期 、 字 符 串 等 数据 类 型 的 高 效 索引 ; 支持 丰富 的 查询 语言 ， 同 时 支持 32 位 与 64 位 硬件 
fe 平台 下 的 Windows、Linux 等 主流 操作 系统 。 索 引 速 度 高 达 9M/s， 文 持 在 线索 引 ， 实 现 
© 坚 秒 级 草 查 询 。 


4. 舆情 综合 挖掘 
提供 被 监测 信息 源 的 一 站 式 、 全 方位 的 监控 和 浏览 。 


全 情 综合 挖掘 面向 互联 网 日 益 增 长 的 与 情 监测 、 竞 争 情报 与 危机 公关 需求 ， 对 从 互联 网 
上 采集 到 的 论坛 、 博 客 、 新 闻 、 搜 索引 擎 、 新 闻 评 论 、 跟 贴 、 图 片 、 音 视频 等 信息 ， 综 合 挖 
抉 分析， 实现 话 题 的 自动 发 现 和 全 方位 跟踪 、 济 源 ， 提 供 时 间 、 空 间 分 布 及 趋势 分 析 ; 对 文 
章 、 评 论 的 倾向 性 进行 智能 分 析 ; 深入 挖掘 网 络 对 象 之 间 的 关系 ; 推送 有 价值 的 与 情 信 息 和 
统计 报表 ， 提 供 熏 情 监测 与 危机 公关 应 对 服务 。 


天 珊 网 络 与 情 监 测 系统 架构 具有 良好 的 可 扩展 性 ， 可 根据 需求 灵活 定制 ， 已 在 政府 、 金 
融 、 教育 等 行业 用 户 取得 了 良好 的 应 用 效果 。 天 丽 系 统 已 经 广泛 地 应 用 于 工信部 、 广 电 总 局 、 
证 监 会 等 关键 部 门 ， 发 挥 了 实际 作用 。 其 中 , 在 中 国 证 监 会 建设 的 网 络 信 息 监控 系统 使 得 证 
监 会 的 舆情 监控 工作 取得 了 长 足 的 进步 ， 为 维护 资本 市 场 的 稳定 ， 保 护 中 小 投资 者 的 利益 ， 
提供 了 有 效 的 支持 ， 获 得 了 2009 年 度 证 券 期 货 业 科学 技术 奖 二 等 奖 。 


天 珊 与 情 系 统 概述 
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